줄기 잎 그림
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
줄기 잎 그림은 데이터를 시각적으로 표현하는 방법으로, 관측치를 오름차순으로 정렬하여 줄기와 잎으로 구분하여 나타낸다. 데이터의 분포, 이상치, 최빈값을 파악하는 데 유용하며, 중간 크기의 데이터 세트(약 15~150개)에 적합하다. 줄기는 숫자의 자릿수를 나타내고, 잎은 각 줄기에 해당하는 마지막 자릿수를 나열한다. 대한민국 중학교 수학 교육 과정에서 자료 해석 능력을 키우는 데 활용된다.
더 읽어볼만한 페이지
줄기 잎 그림 | |
---|---|
개요 | |
유형 | 기술통계학 |
설명 | 자료의 분포 형태를 시각적으로 표현하는 방법 |
관련 항목 | 히스토그램, 상자 수염 그림 |
정의 | |
목적 | 데이터 집합의 분포를 간결하게 보여주고 데이터의 중심 경향과 퍼짐 정도를 파악하는 데 도움을 준다. |
특징 | 데이터를 정렬하여 줄기 부분과 잎 부분으로 나눈다. 줄기는 일반적으로 가장 왼쪽 자릿수를 나타내고, 잎은 그 다음 자릿수를 나타낸다. 자료의 원래 값을 보존하면서 시각적인 정보를 제공한다. |
사용법 | |
구성 요소 | 줄기: 가장 왼쪽 자릿수 (예: 십의 자리) 잎: 그 다음 자릿수 (예: 일의 자리) |
작성 방법 | |
예시 | 데이터: 12, 15, 21, 23, 23, 29, 31, 35, 42, 43 줄기-잎 그림: |
장단점 | |
장점 | 데이터의 분포를 쉽게 파악할 수 있다. 자료의 원래 값을 유지한다. 간단하고 쉽게 만들 수 있다. |
단점 | 데이터 양이 많을 경우 표현하기 어렵다. 연속적인 데이터에는 적합하지 않을 수 있다. 다른 시각화 방법에 비해 정보 전달력이 제한적일 수 있다. |
추가 정보 | |
변형 | 분할 줄기-잎 그림: 각 줄기를 여러 번 사용하여 더 자세한 분포를 나타낸다. 정렬된 줄기-잎 그림: 잎을 크기 순서대로 정렬하여 분포를 더 명확하게 보여준다. |
활용 분야 | 교육: 데이터 분포를 쉽게 이해하도록 돕는다. 통계 분석: 데이터의 특징을 파악하고 분석하는 데 활용된다. 품질 관리: 공정 데이터의 분포를 모니터링하는 데 사용된다. |
참고 문헌 |
2. 구성 방법
줄기 잎 그림을 구성하려면, 먼저 관측치를 오름차순으로 정렬해야 한다.[1] 그런 다음, 줄기와 잎이 무엇을 나타낼지 결정해야 하는데, 일반적으로 잎은 숫자의 마지막 자릿수를, 줄기는 나머지 자릿수를 포함한다. 매우 큰 숫자는 특정 자릿수(예: 백의 자리)로 반올림하여 잎에 사용하고, 나머지 숫자는 줄기로 사용한다.
줄기 잎 그림은 수직선으로 구분된 두 개의 열로 그리며, 줄기는 왼쪽에, 잎은 오른쪽에 오름차순으로 나열한다. 각 줄기는 한 번만, 잎이 없는 줄도 숫자를 건너뛰지 않고 나열해야 한다. 데이터에 반복되는 숫자가 있으면 모두 표시해야 한다.
반올림이 필요할 수 있으며, 음수는 줄기 단위 앞에 배치하고, 정수가 아닌 숫자는 반올림한다. 이를 통해 복잡한 데이터 집합에서도 줄기 잎 그림의 모양을 유지할 수 있다.
2. 1. 데이터 정렬
줄기 잎 그림을 만들려면 먼저 관측치를 오름차순으로 정렬해야 한다.[1] 손으로 작업하는 경우, 잎을 정렬하지 않은 상태로 줄기 잎 그림 초안을 작성한 다음, 잎을 정렬하여 최종 줄기 잎 그림을 생성하는 것이 가장 쉽다.[1]다음은 정렬된 데이터 값의 예시이다.
: 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106
2. 2. 줄기와 잎 결정
일반적으로 잎은 숫자의 마지막 자릿수를 포함하고 줄기는 다른 모든 자릿수를 포함한다. 매우 큰 숫자의 경우 데이터 값을 특정 자릿수(예: 백 자리)로 반올림할 수 있으며, 이 자릿수가 잎에 사용된다. 반올림된 자릿수의 왼쪽에 있는 나머지 숫자는 줄기로 사용된다.잎은 일의 자릿수를 나타내고 줄기는 나머지 숫자(십의 자릿수 이상)를 나타낸다.
줄기 잎 그림은 수직선으로 구분된 두 개의 열로 그려진다. 줄기는 수직선의 왼쪽에 나열된다. 각 줄기는 한 번만 나열되어야 하며, 일부 줄에 잎이 없더라도 숫자가 건너뛰지 않아야 한다. 잎은 각 줄기의 오른쪽에 있는 행에 오름차순으로 나열된다.
데이터에 반복되는 숫자가 있는 경우(예: 72가 두 개), 플롯에 반영되어야 한다(따라서 72 72 75 76 77이 있는 경우 플롯은 7 | 2 2 5 6 7처럼 보일 것이다).
Stem | Leaf |
---|---|
4 | 4 6 7 9 |
5 | |
6 | 3 4 6 8 8 |
7 | 2 2 5 6 |
8 | 1 4 8 |
9 | |
10 | 6 |
Key:
Leaf unit: 1.0
Stem unit: 10.0
줄기 잎 그림을 만들려면 반올림이 필요할 수 있다. 음수의 경우 음수가 줄기 단위 앞에 배치되며, 이는 여전히 X / 10의 값이다. 정수가 아닌 숫자는 반올림된다. 이를 통해 줄기 잎 플롯이 더 복잡한 데이터 집합에서도 모양을 유지할 수 있다.
Stem | Leaf |
---|---|
-2 | 4 |
-1 | 2 |
-0 | 3 |
0 | 4 6 6 |
1 | 7 |
2 | 5 |
3 | |
4 | |
5 | 7 |
2. 3. 그림 그리기
관측치를 오름차순으로 정렬한다. 손으로 작업하는 경우, 먼저 잎을 정렬하지 않은 상태로 초안을 작성한 다음, 잎을 정렬하여 최종 줄기 잎 그림을 생성하는 것이 가장 쉽다. 다음은 정렬된 데이터 값의 예시이다.: 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106
다음으로 줄기가 무엇을 나타내고 잎이 무엇을 나타낼지 결정해야 한다. 일반적으로 잎은 숫자의 마지막 자릿수를 포함하고 줄기는 다른 모든 자릿수를 포함한다. 매우 큰 숫자의 경우 데이터 값을 특정 자릿수 (예: 백 자리)로 반올림할 수 있으며, 이 자릿수가 잎에 사용된다. 반올림된 자릿수의 왼쪽에 있는 나머지 숫자는 줄기로 사용된다.
이 예제에서 잎은 일의 자릿수를 나타내고 줄기는 나머지 숫자(십의 자릿수 이상)를 나타낸다.
줄기 잎 그림은 수직선으로 구분된 두 개의 열로 그려진다. 줄기는 수직선의 왼쪽에 나열된다. 각 줄기는 한 번만 나열되어야 하며, 일부 줄에 잎이 없더라도 숫자가 건너뛰지 않아야 한다. 잎은 각 줄기의 오른쪽에 있는 행에 오름차순으로 나열된다.
데이터에 반복되는 숫자가 있는 경우(예: 72가 두 개)는 모두 표시해야 한다.
줄기 | 잎 |
---|---|
4 | 4 6 7 9 |
5 | |
6 | 3 4 6 8 8 |
7 | 2 2 5 6 |
8 | 1 4 8 |
9 | |
10 | 6 |
:Key: 6|3 = 63
:Leaf unit: 1.0
:Stem unit: 10.0
줄기 잎 그림을 만들려면 반올림이 필요할 수 있다. 다음 데이터 집합을 기반으로 아래와 같이 줄기 잎 그림이 생성된다.
: −23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8
음수의 경우 음수가 줄기 단위 앞에 배치되며, 이는 여전히 X / 10의 값이다. 정수가 아닌 숫자는 반올림된다.
줄기 | 잎 |
---|---|
-2 | 4 |
-1 | 2 |
-0 | 3 |
0 | 4 6 6 |
1 | 7 |
2 | 5 |
3 | |
4 | |
5 | 7 |
:Key: -2|4 = -24
2. 4. 예시
관측치를 오름차순으로 정렬하면 다음과 같다.: 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106
일반적으로 잎은 숫자의 마지막 자릿수를 포함하고 줄기는 다른 모든 자릿수를 포함한다. 이 예제에서 잎은 일의 자릿수를 나타내고 줄기는 나머지 숫자(십의 자릿수 이상)를 나타낸다. 줄기 잎 그림은 수직선으로 구분된 두 개의 열로 그려진다. 줄기는 수직선의 왼쪽에 나열되며, 각 줄기는 한 번만 나열된다. 잎은 각 줄기의 오른쪽에 있는 행에 오름차순으로 나열된다. 데이터에 반복되는 숫자가 있는 경우(예: 72가 두 개), 플롯에 반영되어야 한다.
줄기 | 잎 |
---|---|
4 | 4 6 7 9 |
5 | |
6 | 3 4 6 8 8 |
7 | 2 2 5 6 |
8 | 1 4 8 |
9 | |
10 | 6 |
줄기 잎 그림은 데이터의 상대적인 밀도와 모양을 시각적으로 보여주어 자료의 분포를 파악하는 데 유용하다. 또한 이상치를 강조하거나 최빈값을 찾는 데도 도움이 된다.
Key: 6|3 = 63
3. 활용
3. 1. 장점
줄기 잎 그림은 데이터의 상대적인 밀도와 모양을 표시하여 독자에게 분포에 대한 빠른 개요를 제공하는 데 유용하다. (대부분의) 원시 수치 데이터를 그대로 유지하면서 이상치를 강조하고 최빈값을 찾는 데 유용하다.
하지만 줄기 잎 그림은 약 15~150개 데이터 포인트 정도의 중간 크기의 데이터 세트에만 유용하다. 데이터 세트가 매우 작을 경우, 줄기 잎 그림은 결정적인 분포 속성을 설정하는 데 필요한 데이터 포인트 수가 부족하여 거의 쓸모가 없을 수 있으며, 이런 경우에는 점 그림이 더 적합하다. 반대로 데이터 세트가 매우 큰 경우에는 각 데이터 포인트를 숫자적으로 나타내야 하므로 줄기 잎 그림이 매우 복잡해지고, 상자 그림 또는 히스토그램이 더 적절할 수 있다.
3. 2. 한계
줄기 잎 그림은 중간 크기의 데이터 세트(약 15~150개의 데이터 포인트)에만 유용하다. 데이터 세트가 매우 작으면 줄기 잎 그림은 결정적인 분포 속성을 설정하는 데 필요한 데이터 포인트 수가 부족하여 유용성이 떨어질 수 있다. 이러한 경우에는 점 그림이 더 적합할 수 있다. 반대로 데이터 세트가 매우 크면 각 데이터 포인트를 숫자로 나타내야 하므로 줄기 잎 그림이 매우 복잡해진다. 데이터 크기가 증가함에 따라 상자 그림 또는 히스토그램이 더 적절해질 수 있다.
4. 비수치적 활용
줄기 잎 그림은 비수치 정보를 전달하는 데에도 사용할 수 있다. 예를 들어 콜린스 스크래블 단어집(미국 이외 지역의 스크래블 토너먼트에서 사용되는 단어 목록)에 있는 유효한 두 글자 단어를 나타낼 때, 단어의 첫 글자를 줄기로 사용하여 시각화 할 수 있다.
위의 그림을 통해 가장 흔한 세 개의 첫 글자가 o, a, e임을 쉽게 알 수 있다.[5]

참조
[1]
서적
Exploratory Data Analysis
https://archive.org/[...]
Pearson
1977
[2]
문서
Function in Octave
https://octave.sourc[...]
[3]
문서
Function in R
https://www.rdocumen[...]
[4]
문서
MATLAB's and Matplotlib's stem functions
http://www.mathworks[...]
[5]
웹사이트
Two-Letter Scrabble Words Visualized as Stem and Leaf Plot
http://gideongoldin.[...]
2020-10-01
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com